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(54) Tide: CHROMATTN-REGULATOR GENES 
(54) Bezeichnung: CHROMAHN-REGULATORGENE 
(57) Abstract 

The invention concerns the deregulation of chromatin-regulator genes which have an SET domain, such deregulation being of 
importance in certain cancer conditions. These genes, in particular the SET domains as such, can be used in the diagnosis and therapy of 
such conditions. 

(57) Zusammenmssung 

Die Deregulation von Omsnatinregulatoigenen, die eine SET-Domflne aufweisen, spielt eine Rolle bei bestimmten Kiebseifcrankun- 
gen. Diese Gene konnen somit, insbesondere die SET-DomSne als solche, als Grundlage fur die Diagnose und Therapie dieser Erkrankungen 
dienen. 
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Chroma t in - Regulat orgene 

Die vorliegende Erfindung bezieht sich auf Gene, die 
eine Rolle bei der strukturellen und funktionellen 
Regulation von Chromatin spielen, und ihre Verwendung 
fur die Therapie und Diagnostik. 

Die funktionelle Organisation von eukaryotischen 
Chromosomen in Centromere , Telomere sowie in eu- und 
heterochromatische Regionen stellt einen entscheidenden 
Mechanismus zur Gewahrlei stung der genauen Replikation 
und Verteilung der genetischen Information bei jeder 
Zellteilung dar. Im Gegensatz dazu sind Tumorzellen 
haufig durch chromosomale Rearrangements, 
Trans lokationen und Aneuploidie charakterisiert 
(Solomon et al., 1991; Pardue, 1991). Obwohl die 
Mechanismen, die zu einer erhohten 

Chromosomeninstabilitat in Tumorzellen fuhren, noch 
nicht geklart sind, haben es in jungster Zeit eine 
Reihe von experiment ellen Systemen, beginnend mit 
telomerischen Positionsef fekten in Hefe (Renauld et 
al., 1993; Buck und Shore, 1995; Allshire et al., 

1994) , uber Positionsef fekt -Variegation (PBV) in 
DroBophila (Reuter und Spierer, 1992), bis zur Analyse 
von Translokationsbruchpunkten in humanen Leuk&nien 
(Solomon et al., 1991; Cleary, 1991), ermSglicht, 
einige chromosomale Proteine zu identif izieren, die an 
der deregulierten Proliferation ursachlich beteiligt 
sind. 

Erstens wurde f estgestellt, daS die Dberexpression 
einer verkurzten Version des SIR4 -Proteins zu einer 
verlangerten Lebensdauer in Hefe fuhrt (Kennedy et al., 

1995) . Da SIR-Proteine zum Entstehen multimerer 
Komplexe cin den stillen "Mating Type Loci" und am 
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Telomer beitragen, k6nnte es sein, daS uberexprimiertes 
SIR4 mit diesen heterochromatinartigen Komplexen 
interf eriert , was schliefilich zu einer unkontrollierten 
Proliferation fuhrt. Diese Annahme steht im Einklang 
mit der HSufigkeit des Auftretens einer deregulierten 
TelomerenlSnge in den meisten humanen Krebsarten 
(Counter et al., 1992). 

Zweitens wurden mittels genetischer Analysen von PEV in 
Drosophila eine Reihe von Genprodukten identif iziert, 
die die Chromatinstruktur an heterochromatischen 
Positionen und innerhalb des homeotischen Genclusters 
verandern (Reuter und Spierer, 1992) . Mutationen 
einiger dieser Gene, wie modulo (Garzino et al. # 1992) 
und polyhomeotic (Smouse und Perrimon, 1990) , konnen in 
Drosophila die deregulierte Zellproliferation oder den 
Zelltod verursachen. Drittens wurden S&ugetierhomologe 
von sowohl Aktivatoren {trithorax oder trx-Gruppe) als 
auch Repressoren (z.B. polycomb oder Pc-Gruppe) der 
Chromatinstruktur von homeotischen Drosophila- 
Selektorgenen beschrieben. Unter diesen hat sich vom 
hximanen HRX/ALL-1 (trx-Gruppe) gezeigt, daS es an der 
durch Translokation induzierten Leukamogenese beteiligt 
ist (Tkachuk et al w 1992; Gu et al. f 1992), und daS 
die Obereaq>ression des Maus-Jbmi (Pc-Gruppe) zum 
Entstehen von Lymphomen ffihrt (Haupt et al., 1991; 
Brunk et al., 1991; Alkema et al., 1995). Ein Modell 
fxir die Funktion chromosomaler Proteine la£t darauf 
schlieSen, daS diese multimere Komplexe bilden, welche 
in Abhangigkeit von der Ausgewogenheit zwischen 
Aktivatoren und Repressoren im Komplex den 
Kondensationsgrad der umliegenden Chromatinregion 
bestimmen (Locke et al., 1988). Eine Verschiebung 
dieses Gleichgewichts durch flberexpression einer der 
Komponenten des Komplexes zeigte eine Neuverteilung von 
eu- und heterochromatischen Regionen (Buck und Shore, 
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1995; Reuter und Spierer, 1992; Eissenberg et al., 
1992) . Dieser Dosiseffekt kann die Chroma t ins truktur an 
vorbestimmten Loci destabilisieren, was letztlich zu 
einem Ubergang vom normalen zum transformierten Zustand 
fuhrt. 

Trotz der Charakterisierung von HRX/ALL-1 und bmi als 
Protoonkogene, die die Chromatinstruktur verandern 
k6nnen, ist das Wissen uber Saugetiergenprodukte, 
welche mit Chromatin wechselwirken, noch sehr 
beschrSnkt. Im Gegensatz dazu wurden durch genetische 
Analysen von PEV in Drosophila ca. 120 Allele fur 
Chromatinregulatoren beschrieben (Reuter und Spierer, 
1992) . Kurzlich wurde eine carboxyterminale Region mit 
Ahnlichkeit in der Sequenz identif iziert, die einem 
posit iven (_trx, trx-Gruppe) und einem negativen iE(z) , 
Pc-Gruppe) Drosophila- Chromatinregulator (Jones und 
Gelbart, 1993) gemeinsam ist. Dariiberhinaus ist dieser 
Carboxyterminus auch in fiu(var)3-9, einem dominanten 
Supressor der Chromatinverteilung in Drosophila, 
konserviert (Tschiersch et al., 1994). 

Bei der vorliegenden Erf indung wurde von der Uberlegung 
ausgegangen, daft diese als "SET" bezeichnete 
ProteindomSne (Tschiersch et al., 1994) wegen ihrer 
evolutionaren Konservierung und dem Vorhandensein in 
antagonist ischen Genprodukten eine neue Genf amilie 
entwicklungsgeschichtlich wichtiger Saugetier- 
Chromatinregulatoren definiert. Daruberhinaus tragt die 
Charakterisierung weiterer Mitglieder der Gruppe von 
SET-Domane-Genen, neben HRX/ALL-1, zur Aufklarung der 
Mechanismen bei, die dafflr verantwortlich sind, daS 
strukturelle Veranderungen im Chromatin zur malignen 
Transformation fuhren k6nnen. 
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Der vorliegenden Erf inching lag somit die Aufgabe 
zugrunde, humane Chromatinregulatorgene zu 
identifizieren, ihre Funktion aufzuklaren und sie fur 
die Diagnostik und Therapie einzusetzen. 

Zur Losung dieser Aufgabe wurde zunachst die 
Sequenzinforraation der SET-Dom^ne benutzt, um aus 
humanen cDNA-Banken die zu den SET-Domane-Genen von 
Drosophila homologen humanen cDNAs zu erhalten. Es 
wurden zwei cDNAs erhalten , die Humanhomologe von E(z) 
bzw. Su(var)3-9 darstellen; die entsprechenden humanen 
Gene wurden als EZH2 und SUV39H bezeichnet (vgl. - 
unten) ; aufierdem wurde eine variante Form von EZH2 
identifiziert, die als EZH1 bezeichnet wurde. 

Die vorliegende Erfindung betrifft somit DNA-Molekiile , 
enthaltend eine fur ein Oiromatinregulator-Protein, das 
eine SET-Domane aufweist, kodierende Sequenz Oder eine 
Teilsequenz davon, dadurch gekennzeichnet , daS sie die 
in Fig, 6 oder in Fig. 7 dargestellte Nukleotidsequenz 
aufweisen. Die erf indungsgemafien DNA-Molekule werden im 
folgenden auch als "erf indungsgem&fie Gene" bezeichniet. 

Die erf indungsgemafien Gene tragen die Bezeichnung EZH2 
und SUV39H, sie wurden ursprQnglich als "HEZ-2" und 
n H3-9 n bezeichnet. 

Die Erfindung betrifft in einem weiteren Aspekt die von 
diesen Genen abgeleiteten cDNAs, einschliefilich ihrer 
degenerierten Varianten; Mutanten, die fur funktionelle 
Chromatinregulatoren kodieren sowie Varianten, die auf 
eine Genduplikation zuruckzufuhren sind; ein Beispiel 
dafur ist EZH1, dessen Teilsequenz im Vergleich mit 
EZH2 in Fig. 8 dargestellt ist. 
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Zur Losung der im Rahmen der vorliegenden Erf indung 
gestellten Aufgabe wurde im einzelnen wie f olgt 
vorgegangen: Ausgehend von der Sequenzinf ormation von 
der konservierten SET-Domane, wurde unter reduzierter 
Stringenz eine humane B-Zell-spezif ische cDNA- 
Bibliothek mit einer gemischten Droeophila-BNA- Sonde, 
die fur die SET-Domanen von E(z) und Su(var)3-9 
kodiert, gescreent. Aus 500.000 Plaques wurden 40 
primare Phagen ausgewahlt. Nach zwei weiteren Runden 
Screening zeigte sich, daS 31 Phagen fiir authentische 
E(z) -Sequenzen kodieren und dafi funf Phagen E(z)- 
Varianten darstellen. Im Gegensatz dazu hybridisierten 
nur zwei Phagen mit der Sonde, die die SET-Domane von 
£u(var)3-9 allein enthielt. Die Phageninserts wurden 
mittels Polymer asekettenreakt ion (PCR) amplifiziert und 
mittels Restriktionskartierung und Teilsequenzierung 
analysiert. Representative cDNA- Inserts wurden 
subkloniert und fiber ihre ganze Lange sequenziert. Die 
5 f -Enden wurden isoliert, indem positive Phagen. noch 
einmal mit 5' -DNA-Sonden gescreent wurden, worauf nach 
Subklonierung komplette cDNAs erhalten wurden. 

Die komplette, fiir das humane Homologe von E{z) 
kodierende cDNA wurde als EZH2 und die DNA, die fiir das 
humane Homologe von Su(var)3-9 kodiert, wurde als 
SUV39H bezeichnet. Insgesamt betr&gt die IdentitSt der 
Aminosauren zwischen Drosophila und den humanen 
Proteinen 61 % fur EZH2 und 43 % fiir SUV39H, wobei die 
C-terminale SET-Domane sehr hoch konserviert ist 
(88 % fiir EZH2 und 53 % fiir SUV39H) . Der 
Sequenzvergleich zeigte weitere deutliche 
Homologieregionen, z.B. eine Cystein-reiche Domane in 
EZH2 und eine Chromo-Box in SUV39H. (In polycomb wurde 
gezeigt, daE die Chromo-Box die fQr die Wechselwirkung 
zwischen DNA und Chromatin wesentliche DomSne ist; 
Messmer et al., 1992). Im Gegensatz dazu fehlen die 
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207 Aminosauren, die das aminoterminale GTP- 
Bindungsmotiv des Drosophila- Proteins enthalten, im 
humanen Homologen SUV39H. 

Der Vergleich der Aminosaure-Sequenzen zwischen den 
Drosophila- und den humanen Genen ist in den Fig. 1 
und 2 dargestellt: 

Fig. 1 zeigt den Vergleich der Aminosaure-Seqttenz 
zwischen EZH2 und von Drosophila Enhancer von zeste 
{E(z)) . Identische Aminosauren der konservierten 
carboxyterminalen SET-Domane (schattierte Box) und der 
Cys-reichen Region (Cys-Reste sind hervorgehoben) sind 
gezeigt. Die mutmafilichen Kernlokalisierungssignale 
sind unterstrichen. 

Fig. 2 zeigt den Vergleich der Aminosaure-Sequenz 
zwischen dem humanen Homologen SUV39H und Drosophila 
Su(var)3-9. Identische Aminosauren der konservierten 
carboxyterminalen SET-Domane (schattierte Box) und der 
Chromo-Domane (dunkler schattierte Box) sind 
dargestellt. Die mutmaSlichen Kernlokalisierungssignale 
sind unterstrichen. Oben in der Figur ist eine 
schematische fjbersicht der beiden Proteinstrukturen 
dargestellt , die zeigt, daS im humanen Homologen 
207 AminosSuren am N-Terminus fehlen. 

Da trcmslationale Consensus sequenzen in Umgebung des 
Start -ATG der humanen SUV39H- cDNA auch an der 
entsprechenden internen Position in £u(var)3-9 
vorhanden sind, dilrfte das Drosophila-Protein 
zusatzliche Exons enthalten, die in einem sp&teren 
Stadium der Evolution flir die Funktion entbehrlich 
wurden. (Die Richtigkeit dieser Hypothese kann 
best&tigt werden, indem die humane SC7V3SH-CDNA und 
komplette oder am B'-Ende verldirzte cDNAs von 
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Su(var)3-9 in DroBophxla exprimiert werden. 
Dariiberhinaus wurde eine weitere cDNA der Bezeichnung 
MG-44 beschrieben 

(s. unten) , der ebenfalls das 5'-Ende des Drosophila- 
Gens fehlt.) Zus&tzlich zur humanen cDNA von 3UV39H 
wurde auch der homologe Locus in der Maus (Suv39h; 
siehe unten) isoliert, dessen Sequenzanalyse und 
Promotorstruktur eindeutig die aminoterminale 
Verkurzung saugerhomologer Gene im Vergleich zu 
DroBophila Su(var)3-9 bestatigt. 

Im Rahmen der vorliegenden Erf indung durchgefuhrte DNA- 
Blot-Analysen deuten darauf hin, daS saugerhomologe 
Gene von Su(var)3-9 in der Maus und im Menschen von 
einzelnen Loci reprasentiert werden, w&hrend 
saugerhomologe Gene von E(z) in der Maus und im 
Menschen durch zwei getrennte Loci kodiert sind. Der 
zweite humane Locus (als EZH1 bezeichnet) wurde auch 
durch Charakterisierung einer kleinen Anzahl von cDNA- 
Varianten, die sich in ihren 3 1 -f lankierenden Sequenzen 
von der Mehrzahl der aus der humanen cDNA-Bibliothek 
isolierten Klone unterscheiden, bestatigt. Die 
Unterschiede zwischen EZH2 und EZH1 im sequenziertien 
Bereich sind in Pig. 8 dargestellt: Die SET-DomSne von 
EZHl zeigt gegenCkber EZH2 Mutationen; auEerdem tragt 
die von uns isolierte EZHl - Variant e (sehr 
wahrscheinlich eine aberrant gespleiSte cDNA) ein sich 
im Leserahmen befindliches Stopcodon, welches das 
Protein urn die 47 C-terrainalen Aminosauren verkiirzt. In 
Pig. 8 ist die Nukleotidsequenz der EZH2-cDKh von 
Position 1844 bis 2330 in der jeweils oberen Zeile 
dargestellt, wobei die 5 1 Spleifistelle und das 
potent ielle Stopcodon unterstrichen sind. Um eine 
Teilsequenz der cDNA der B2H1-Varicuite der EZH2 - Sequenz 
zuzuordnen, wurde das gap-Programm des Wisconsin GCG 
Netzwerkservice verwendet. Das vorzeitige Stopcodon in 
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EZH1 (Position 353) ist unterstrichen. Sequenzen, die 
fur die konservierte SET-Domane kodieren, sind 
hervorgehoben . AuSerdem ist das 3 1 -Ende (Position 151 
in EZH1) des aberranten Transkripts B52 (s. unten) 
dargestellt. TJber die verfugbare Sequenz zeigte sich 
B52 zu 97 % identisch mit EZH1 und zu 72 % identisch 
mit EZH2. Der Sequenzvergleich von EZH1 mit EZH2 sowie 
die Feststellung, daS beim Menschen und der Maus zwei 
getrennte EfzJ-homologe Loci auftreten, lassen darauf 
schliefien, dafi bei Sfiugern eine Genduplikation 
aufgetreten ist. 

In einem Vergleich mit cDNA- Sequenzen in der Datenbank 
GeneBank wurde ilberraschend f estgestellt , daS bestimmte 
in der Datenbank eingetragene cDNA-Teilsequenzen, die 
von aberranten Transkripten in Tumorgeweben abgeleitet 
sind, mutierte Versionen der erf indungsgemafien cDNAs 
darstellen: 

Einerseits war auf der Suche nach BRCA1, einem Gen, das 
fur Brust- und Eileiterkrebs pradisponiert , eine 
partielle cDNA-Sequenz mit 271 Nukleotiden der 
Bezeichnung B52, die fur eine mutierte Variante der 
SET-Domane kodiert, isoliert und auf dem humanen 
Chromosom 17q21 kartiert worden (Friedman et al., 
1994) . Es wurde im Rahmen der vorliegenden Erfindung 
ilberraschend f estgestellt , daS B52 97 % Identitat mit 
der erfindungsgemafien JBZHI-cDNA- Variante aufweist (vgl . 
oben) ; m&glicherweise stellt EZH1 ein Gen dar, dessen 
Reaktivierung bei der deregulierten Proliferation eine 
Rolle spielt. 

Andererseits war eine cDNA (2.800 Nukleotide; MG-44) 
vom humanen Chromosom Xpll isoliert worden (Geraghty 
et al., 1993), einer Region, die fur degenerative 
Storungen der Netzhaut und Synovialsarkome 
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pradisponiert . Es wurde uberraschend f estgestellt , dafi 
diese cDNA 98 % Identitat mit der erf indungsgemafien 
SUV3 5H- cDNA aufweist. 

Die im Rahmen der vorliegenden Erf indung 
bereitgestellten neuen Gene ermoglichen es somit, einen 
Zusammenhang zwischen bestimmten Krebserkrankungen und 
Mutationen in Chromatinregulatoren herzuleiten; im 
Falle der MG-44-cDNA konnte, da diese mehrere Punkt- 
und Frameshift -Mutationen aufweist, welche die Chromo- 
und SET-Domanen unterbrechen, erst anhand der 
erf indungsgemafien 

SUV39H- cBNA ein Zusammenhang zwischen Su(var)3-9 und 
MG-44 aufgekl&rt werden. 

- Neben den bereits genannten Sequenzen sind in der 

Sequenzdatenbank GeneBank als weitere humane Mitglieder 
der SET-Proteinfamilie das gut dokumentierte humane 
Homologe von Drosophila trx, HRX/ALL-1 (Tkachuk et al., 
1992; Gu et al., 1992) eingetragen, ferner ein Gen 
unbekannter Funktion der Bezeichnung G9a, das im 
humanen Major Histocompatibility Complex (Milner und 
Campbell, 1993) vorhanden ist, drittens eine nicht. 
publizierte cDNA (KG-1) , die aus unreifen myeloiden 
Tumorzellen isoliert wurde (Nomura et al., 1994). 
Wahrend G9a derzeit das einzige humane Gen mit einer 
SET-Domane ist, fur das bisher keine mutierte Version 
bekannt ist, tragt KG-1 eine Insertion von 342 
Aminosauren, welche die SET-Domane in eine Amino- und 
eine torboxyterminale HSlfte spaltet. Wahrscheinlich 
stellt diese JCG-I-cDNA eine aberrant gespleifite 
Variante dar, da sich 5 1 und 3 1 Konsensus-SpleiSstellen 
and beiden Enden der Insertion finden. Insgesamt sind 
vier der funf derzeit bekannten humanen Mitglieder der 
SET-Proteinfamilie Anderungen unterworfen, die alle die 
SET-Domane mutieren (HRX/ALL-1, EZH1/B52, SUV39H/MG-44 
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und KG-1) . Daruberhinaus wurden in drei Fallen die 
entsprechenden humanen Genloci in der Nahe von 
Trans lokationsbruchpunkt en oder instabilen 
chromosomalen Regionen kartiert (HRX/ALL-l, EZH1/B52 
und SUV39H/MG-44) . In Fig. 3 sind die aberranten 
Transkripte von humanen SET-Domane-Genen dargestellt. 
Links in der Figur ist die Lage der funf derzeit 
bekannten SET-DomSne-Gene auf dem jeweiligen Chromosom 
angegeben. U.a. sind die drei Gene {HRX/ALL-l, EZH1/B52 
und SUV39H/MG-44) , fUr die aberrante cDNAs auf 
Translokationsbruchpunkten oder instabilen 
Chromatinregionen kartiert wurden, dargestellt. Vier 
der fiinf dargestellten SET-Domanen Gene weisen 
Mutationen auf/ die alle die Carboxyterminale SET- 
Dora&ne unterbrechen, welche in der Figur durch die 
dunkle Box dargestellt ist. Eine Translokation 
verbindet die aminoterminale Halfte von HRX mit einer 
nicht korrelierten Gensequenz, die als gepunktete Box 
mit der Bezeichnung ENL dargestellt ist. Mutationen und 
ein vorzeitiges Stopcodon ver&ndem die SET-Domane von 
EZH1/B52. Punkt- und Frameshift -Mutationen unterbrechen 
die Chromo- und SET-Domane in JAG- 44. Eine groSe 
Insertion spaltet die SET-Domane von KG-1 in zwei 
Half ten. Aberrante Transkripte sind derzeit fur G9a 
nicht bekannt. Das Cystein-reiche Cluster in B52 ist 
als gepunktete Box dargestellt; in HRX/ALL-l sind die 
Homologieregion zu Methyltransferasen als schraffierte 
Box xind die A/T-Haken als vertikale Linien dargestellt. 
Die Namen der jeweiligen authentischen Gene sind rechts 
in der Figur angegeben. 

Die Tatsache, dafi ein Saugetiergen der SET- 
Proteinfamilie, HRX/ALL-l, mit translokations- 
induzierter Leukamogenese im Zusammenhang gebracht 
wurde (Tkachuk et all, 1992; Gu et al., 1992), ist ein 
starker Hinweis dafur, dafi Proteine mit der SET-Domane 



WO 96/35784 



11 



PCT/EP96/01818 



nicht nur wichtige Regulatoren der Entwicklung sind, 
die chroma tinabhangige Veranderungen der Genexpression 
mitbestimmen, sondern daS sie, nach Mutation, auch die 
normale Zellprolif eration stdren. 

Da alle bisher beschriebenen Mutationen die 
Primarstruktur der SET-Domane unterbrechen, liegt die 
Vermutung nahe, daS es die SET-Domane als solche ist, 
die eine entscheidende Rolle itn Ubergang vom normalen 
zum transformierten Zustand spielt. Eine wichtige 
Funktion fur die SET-Domane kann ferner aufgnmd ihrer 
evolutionaren Konservierung in Genprodukten, die von 
der Hefe bis zum Menschen auftreten, vermutet werden. 

Fig, 4 zeigt die evolutionare Konservierung von SET- 
Domikne-Proteinen: Unter Verwendung des tf asta-Programms 
des Wisconsin GCG Netzwerkservice wurden Proteine und 
of f ene Leserahmen mit Homologie zur SET-Domane 
identif iziert. In der Pigur ist eine representative 
Auswahl von Hefe bis zum Menschen gezeigt. Ziffern 
geben Aminosauren an. Die Carboxyterminale SET-Domane 
ist durch eine schwarze Box dargestellt, Cys-reichei 
Regionen durch eine dunkel gepunktete Box, das GTP- 
Bindungsmotiv in fifu(var)3-9 durch eine hellgepruaktete 
Box und die Chromo - Domane von Su (var) 3-9 und H3-9 durch 
eine off ene Box mit hellen Punkten. Eine Region mit 
Homologie zu Methyltransf erase (trx \ind HRX) ist als 
schraffierte Box dargestellt. A/T- n Haken n ("A/T Hooks") 
sind durch vertikale Linien dargestellt. Eine weitere 
Ser-reiche Region (S in C26E6.10) und eine Glu-reiche 
Region (E in G9a) oder Ankyrin- Repeats (ANK in G9a) 
sind ebenfalls hervorgehoben. YHR119 (GeneBank 
Accession No. U00059) und C26E6.10 (GeneBank Accession 
No. U13875) sind off ene Leserahmen von kurzlich in die 
Datenbank eingetragenen Cosmiden ohne eine funktionelle 
Charakterisierxing. Prozente geben die Gesamtheit der 
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Aminosaure- Identitaten zwischen den humanen und den 
Drosophila- Proteinen an. 

Fig, 5 zeigt die tJbereinstimmung an Aminosauren der 
SET-Domane. Die SET-Domane der in Fig. 4 dargestellten 
Gene wurde unter Verwendung des Pileup-Programms des 
Wisconsin GCG Netzwerkservice angeordnet. Fur den 
Vergleich der KG- 1- SET-Domane wurde vor dem Pileup die 
groSe Aminosaure- Insertion, die die SET-Domane in zwei 
Half ten spaltet, entfemt. Aminosaure- Posit ionen, die 
8 von 10 Ubereinstimmungen aufweisen, sind 
hervorgehoben . 

Aufgrund der im Rahmen der vorliegenden Erf indung 
festgestellten Kriterien erweist sich eine Beteiligung 
der Gene, die eine SET-Domane haben, an der 
chromatinabhangigen Entstehung der deregulierten 
Proliferation; diese Gene bzw. die davon abgeleiteten 
cDNAs sowie Teil- und mutierte Sequenzen k6nnen somit 
bei der Therapie und Diagnose von Erkrankungen, die auf 
eine derartige Proliferation zurflckzufClhren sind, 
eingesetzt werden: 

Unterschiede im Transkriptionsniveau von SET-Dom&ne- 
RNAs zwischen normalen und transformierten Zellen 
konnen als diagnostischer Parameter fiir Erkrankungen 
herangezogen werden, in denen die Expression von SET- 
Domane -Genen dereguliert ist: 

So k6nnen Oligonukleotide, kodierend f\lr die SET-Domane 
als solche bzw. Teilabschnitte davon, als 
diagnostischer Marker verwendet werden, urn bestimmte 
Krebsarten, in denen die SET-Domane mutiert ist, zu 
diagnostizieren. Fur die detaillierte Analyse der 
Funktion der erf indungsgemafien cDNAs oder Abschnitten 
davon im Hinblick auf den diagnostischen Einsatz von 
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SET-Domane-Gensequenzen wurden im Rahmen der 
vorliegenden Erfindung die homologen Maus-cDNAs von 
EZH1 (Ezhl) und SUV39H {Suv39h) isoliert. Bei 
Verwendung einer Maus-spezif ischen, fur die SET-Dom&ne 
kodierenden, DNA-Sonde in "RNAse protection" Analysen 
zur Untersuchung der BzJU-Genaktivitat wahrend der 
normalen Mausentwicklung zeigte sich ein eher breites 
Expressionsprof il, das ahnlich dem von bmi (Haupt et 
al., 1991) ist. Die mit den Maussequenzen 
durchgefuhrten Analysen werden mit Humansequenzen 
ausgeweitet, um die RNA-Mengen zwischen unreifen 
Vorl&uferzellen, Tumorzellen und dif ferenzierten Zellen 
in verschiedenen humanen Zellkultursystemen zu 
vergleichen. Um f estzustellen, ob sich die SET-DomSne 
dement sprechend als diagnostischer Tumormarker ftir 
spezifische Krebserkrankungen oder als genereller 
diagnostischer Parameter eignet, konnen gangige 
Methoden zur Bestimmung der RNA-Konzentration, die in 
einschlSgigen Laborhandbuchern (Sambrook, J., Fritsch, 
E.F. und Maniatis, T., 1989, Cold Spring Harbor 
Laboratory Press) beschrieben sind f wie Northern Blot, 
SI -Nuclease -Protection-Analyse oder RNAse-Protection- 
Analyse, verwendet werden. 

Um die Haufigkeit zu untersuchen, mit der die SET- 
DomSne spezifischen Mutationen unterliegt, konnen die 
SET-spezifischeh DNA-Sonden zur Analyse von 
Einzelstrang-Konformationspolymorphismen (single strand 
conformation polymorphisms; SSCP; Gibbons et al., 1995) 
eingesetzt werden. 

Krebsarten, bei denen SET- spezifische DNA-Sonden als 
diagnostischer Marker verwendet werden kdnnen, sind 
Brustkrebs (EZH1; Friedman et al., 1994), 
Synovialksarkom (SUV39H; Geraghty et al.; 1993) und 
LeukSmien. 
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Aufgrund der Kenntnis der Nukleotidsequenz der SET- 
Dom^ne-Gene konnen die entsprechenden von der cDNA- 
Sequenz abgeleiteten Proteine, die ebenfalls Gegenstand 
der vorliegenden Erf indung sind, in rekombinanter Form 
herstellt werden, indem die dafur kodierenden cDNAs in 
geeignete Vektoren inseriert und in Wirtsorgsuiismen 
exprimiert werden. Die fur die Produktion rekombinanter 
Proteine verwendeten Techniken sind dem 
Durchschnittsfachmann gelauf ig und konnen einschlagigen 
Handbuchern (Sambrook, J., Fritsch, E.F. und 
Maniatis, T. , 1989, Cold Spring Harbor Laboratory- 
Press) entnommen werden. 

Gegenstand der vorliegenden Erf indung sind somit in 
einem weiteren Aspekt rekombinante DNA-Molekule , 
enthaltend die fur EZH2, SUV39H oder EZH1 kodierende 
DNA sowie damit funktionell verbundene 
Expressionskontrollsequenzen, sowie die darait 
transformierten Wirtsorganismen. 

Die erf indungsgemafien rekombinanten Proteine konnen 
eingesetzt werden, um die Wechselwirkung von SET- 
Domane-Proteinen mit Chromatin bzw. mit anderen 
Mitgliedern von Heterochromatinkoinplexen zu 
analysieren; ausgehend von den dabei erhaltenen 
Erkenntnissen uber die Wirkungsweise dieser Komplexe 
werden die sich im einzelnen ergebenden Moglichkeiten 
fur das gezielte Eingreifen in die daran beteiligten 
Mechanismen def iniert und konnen fur therapeutische 
Anwendungen genutzt werden. 

Untersuchungen, die der weiteren Analyse der Funktion 
der SET-Doraane dienen, werden z.B. durchgef uhrt , indem 
cDNAs, kodierend fUr humane s EZH2 bzw. SUV39H und 
versehen mit einem Epitop, gegen das Antikorper zur 
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Verftigung stehen, in vitro sowie in Gewebekulturen 
exprimiert werden. Nach Immunprazipitation mit den 
jeweiligen epitopspezif ischen Antikorpern kann 
festgestellt werden, ob EZH2 und SUV39H tniteinander 
in vitro wechselwirken konnen und ob in vivo eine 
Komplexbildung zwischen EZH2 und/oder S0V39H mit 
weiteren Chromatinregulatoren stattfindet. 

Es wurde bereits von anderen Autoren angenommen 
(DeCamillis et al., 1992; Rastelli et al. f 1993; 
Orlando und Paro, 1993) , dafi eine Komplexbildung 
zwischen verschiedenen Mitgliedern von 
Heterochromatinproteinen wesentlich fur deren Funktion 
ist. Aufgrund der Verfugbarkeit der erf indungsgemaiSen 
SET - Domane - Gene kann festgestellt werden, ob die SET- 
Region eine Domane darstellt, die aufgrund von 
Wechselwirkungen f unktioniert , Oder ob sie zum 
Entstehen multimerer heterochromatischer Komplexe 
beitrSgt. Ebenso kann festgestellt werden, ob die SET- 
Domane eine inhibitorische Funktion hat, ahnlich der 
aminoteiminalen BTB-Domane verschiedener 
Chromatinregulatoren, einschlieElich des GAGA- Fakt or s 
(Adams et al., 1992). Insgesamt erlauben die Analy&en 
von Wechselwirkungen mit Epitop-versehenen EZH2- und 
SOV39H-Proteinen eine weitere CharaJcterisierung der 
Funktion der SET-Domane. Dadurch werden Moglichkeiten 
eroffnet, gegen die deregulierte Aktivitat vorzugehen, 
indem z.B. mitt els gentherapeutischer Methoden 
dominant -negative Varianten der SET-Domane-cDNA- 
Sequenzen in die Zelle eingefiihrt werden. Derartige 
Varianten werden z.B. erhalten, indem zunachst die 
funktionellen Domanen der SET-Proteine def iniert 
werden, z.B. die fur die DNA/ Chr oma t in - oder die fUr 
die Protein/Protein-Wechselwirkung verantwortlichen 
Sequenzabschnitte, und indem dann die urn die 
jeweilige(n) Domane (n) oder urn Abschnitte davon 
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verkiirzten DNA-Sequenzen in der betroffenen Zelle zur 
Expression gebracht werden, um eine durch das intakte 
funktionelle Protein verursachte Deregulation der 
Proliferation zu kompetitieren. 

Die Verfugbarkeit der erf indungsgem&fcen cDNAs erlaubt 
ferner die Herstellung transgener Tiere, z.B. MSuse, in 
denen SET -Domane- Gene entweder flberexprimiert werden 
konnen ("gain-of- function" ) oder in denen diese Gene 
ausgeschaltet werden konnen ( "loss-of -function" ) ; fur 
letztere Analysen werden die korrespondierenden 
Tiersequenzen, insbesondere Maussequenzen, der 
erfindungsgem&fien Gene eingesetzt. Diese M&use sind 
ebenfalls Gegenstand der vorliegenden Erfindung. 

Insbesondere gibt die "gain-of -function"- Analyse, bei 
der Allele der erf indungsgemSfien Gene in die Maus 
eingefuhrt werden, letztlich Aufschlufi ilber die 
ursachliche Beteiligung von EZH2 und SUV39H an der 
chromatinabhangigen F6rderung der Tumor entstehung. Fur 
die "gain-of -function"- Analyse konnen die kompletten 
cDNA-Sequenzen von humanem EZH2 und SUV39H sowie deren 
mutierte Versionen, wie EZH1/B52 und MG-44, mittels 
Vektoren, die hohe Expressionsraten ermdglichen, z.B. 
Plasmiden mit dem humanen fi-Act in- Promoter, getrieben 
sowohl vom Enhancer der schweren Kette von 
Immunglobulinen (E/x) als auch von Moloney- Virus - 
Enhancern (Mo-LTR) . Kiirzlich wurde gezeigt, daS die 
E/i/Mo-LTR-abhangige Uberexpression des bmi-Gens, 
welches gemeinsam mit EZH2 zur Pc-Gruppe negativer 
Chromatinregulatoren zahlt, ausreicht in transgenen 
Mausen Lymphome zu erzeugen (Alkema et al., 1995) . 

Indem in "loss-of -function" -Analysen die endogenen 
Maus-Loci fOr Ezhl und Suv39h durch homologe 
Rekombination in embryonalen Stammzellen unterbrochen 
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werden, kann bestimmt werden, ob der Verlust der 

in vivo-Genfunktion zu einer abnormalen Entwicklung der 

Maus fQhrt. 

Aufgrund dieser in vivo-Systeme kann die Wirkung von 
EZH2 und SUV39H bestStigt werden; diese Systeme dienen 
aufierdem als Grundlage fur Tiermodelle im Hinblick auf 
eine humane Gentherapie. 

Der gentherapeutische Einsatz der erf indungsgemafien 
DNA-Sequenzen oder davon abgeleiteter Sequenzen (z.B. 
komplementarer Antisenseoligonukleotide) erfolgt - je 
nachdem, ob die zu behandelnde Erkrankung auf eine 
Deregulation von Chromatin infolge des Fehlens der 
funktionellen Gensequenz, oder aber infolge einer 
Clberexpression der entsprechenden Gene zurQckzufuhren 
ist - durch Einfuhrung der funktionellen Gensequenz, 
durch Inhibierung der Genexpression, z.B. mit Hilfe von 
Antisenseoligonukleotiden, oder durch Einfuhrung einer 
fiir eine dominant -negative Mutante kodierenden Sequenz. 
Die Einfuhrung der jeweiligen DNA-Sequenzen in die 
Zelle kann mit Hilfe von Standardmethoden fxir die 
Transfektion hoherer eukaryotischer Zellen erfolgeri, zu 
denen der Gentransfer mittels viraler Vektoren 
(Retrovirus, Adenovirus, Adeno-assoziiiertes Virus) 
oder mittels nicht-viralen Systemen auf Basis der 
Rezeptor-vermittelten Endozytose zShlen; Ubersichten 
liber gebrSuchliche Methoden werden z.B. von Mitani und 
Caskey, 1993; Jolly, 1994; Vile und Russel, 1994; 
Tepper und Mule, 1994; Zatloukal et al., 1993, 
WO 93/07283 gegeben. 

PQr eine Inhibierung der Expression der 

erf indungsgemaEen Gene kommen auch niedermolekulare 

Substanzen in Betracht, die in die. 

Transkriptionsmaschinerie eingreifen; nach Analyse der 
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5 1 - regulator ischen Region der Gene kann nach Substanzen 
gescreent werden, die die Wechselwirkung der jeweiligen 
Transkriptionsfaktoren mit dieser Region ganz oder 
teilweise blockieren, z.B. mit Hilfe der in der 
WO 92/13092 beschriebenen Methode. 

Eine Inhibierung der deregulierten Proliferation kann 
auch am Genprodukt ansetzen, indem die entsprechenden 
Antikorper gegen das EZH2- oder SUV39H- Protein, 
vorzugsweise humane oder humanisierte Antikdrper, 
therapeutisch eingesetzt werden. Die Herstellung 
solcher Antik6rper erfolgt nach bekannten Methoden, wie 
sie z.B. von Malavsi und Albertini, 1992, oder von 
Rhein, 1993 , beschrieben wurden. 

Antikorper gegen EZH2 oder SUV39H, die therapeutisch 
oder diagnostisch verwendet werden konnen, sind 
ebenfalls Gegenstand der vorliegenden Erfindung. 

Figurenubers icht 

Aroinosaure-Sequenzvergleich zwischen EZH2 
und E{z) 

AminosSure-Sequenzvergleich zwischen SUV39H 
und Suivar) 3-9 

Aberrante Transkripte von humanen SET-Domane- 
Genen 

Evolutioncire Konservierung von SET-Domane- 
Proteinen 

Aminosaure-Ubereinstimmung in der SET-Domane 
DNA- und Aminosaure-Sequenz von EZH2 
DNA- und Aminosaure-Sequenz von SUV39H 
paartieller Sequenzvergleich zwischen den 
cDKAs von humanem EZH2 und EZH1 



Fig. 1: 

Fig. 2: 

Fig. 3: 

Fig. 4: 

Fig. 5: 

Fig. 6: 

Fig. 7: 

Fig. 8: 
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Beispiel 

a) Herstellung einer cDNA-Bibliothek 

Es wurde eine humane B-Zell-spezif ische cDNA- 
Bibliothek, wie von Bardwell und Treisman, 1994 , 
beschrieben, hergestellt, indem Poly(A)+-RNA aus 
humanen BJA-B-Zellen isoliert, mittels Poly (dT) ^5- 
Priming revers transkribiert und in doppelstr^ngige 
cDNA konvertiert wurde. Nach Zugabe eines EcoRI- 
Adapters der Sequenz 5' AATTCTCGAGCTCGTCGACA wurde die 
cDNA in die EcoRI-Stelle des Bakteriophagen gtlO 
ligiert. Die Propagierung und Amplif izierung der 
Bibliothek erfolgte in E.coli C600. 

b) Herstellung von DNA-Sonden 

Drosqphila-DNA-Sonden, kodierend fur die konservierten 
SET-Domanen von E(z) und Su(var)3-9, wurden auf der 
Grundlage der publizierten Drosophila- Sequenzen (Jones 
und Gelbart, 1993; Tschiersch et al., 1994) mittels 
Polymerasekettenreaktion (PGR) hergestellt: 1 fig von 
Drosophila melanogaa ter-DNA (Clontech) wurde mit den 
beiden Primern E{z) 1910 

{ 5 1 ACTGAATTCGGCTGGGGCATCTTTCTTAAGG ) und E{z) 2280 
(5 1 ACTCTAGACAATTTCCATTTCACGCTCTATG) einer PCR- 
Amplifikation (35 Zyklen zu 30 sek bei 94°C, 30 sek bei 
55°C und 30 sek bei 72°C) unterworfen. Die 
entsprechende SET - Domane - Sonde fur Su(var)3-9 wurde von 
10 ng Plasmid-DNA (Tschiersch et al., 1994; Klon M4) 
mit dem Primerpaar suvar.up 

(5 1 ATATAGTACTTCAAGTCCATTCAAAAGAGG ) und suvar . dn 
(5 1 CCAGGTAC03TTGGTGCTGTTTAAGACCG) amplif iziert, wobei 
dieselben Zyklusbedingungen verwendet wurden. Die 
erhaltenen SET - Domane - DNA- Fragment e wurden Gel- 
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gereinigt und teilsequenziert, um die Richtigkeit der 
amplif izierten Sequenzen zu bestatigen. 

c) Screenen der cDNA-Bibliothek 

5 x 10 5 Plaque -bildende Einheiten ("plague forming 
units", pfu) wurden mit 5 ml Kultur des bakteriellen 
Wirtsstammes E.coli C600 (bei einer optischen Dichte 
ODgQO von 0.5 in 10 mM MgSC>4 suspendiert) bei 37°C 
15 min lang inkubiert und dann auf eine grofie (200 mm 
x 200 mm) vorgewarmte LB-Schale ausgegossen. Nach 
Wachstum fiber Nacht bei 37° C wurden die Phagen auf 
einer Nylonmembran (GeneScreen) absorbiert. Die Membran 
wurde, die Seite mit den absorbierten Phagen nach oben 
schauend, 30 sek lang in Denaturierungsl6sung (1.5 M 
NaCl f 0.5 M NaOH) schwimmen gelassen, dann 60 sek in 
Denaturierungslosung eingetaucht und abschliefiend 5 min 
lang in 3 M NaCl, 0.5 M Tris pH 8, neutralisiert . Dann 
wurde die Membran kurz in 3xSSC gespult und die Phagen- 
DNA mittels UV-Vernetzung auf das Nylonfilter fixiert. 
Das Filter wurde 30 min lang bei 5p°C in 30 ml Church- 
Puffer (1 % BSA, 1 mM EDTA und 0.5 M NaHP0 4f pH 7.2) 
prahybridisiert , anschliefiend wurden 2 x 10 6 cpm der 
radioaktiv markierten DNA-Sondenmischung (E(z) -SET und 
Su(var) 3-9-SET) zugegeben; die DNA-Sonden wurden durch 
Random-priming unter Verwendung des RediPrime-Kit 
(Amersham) hergestellt. Die Hybridisierung wurde iiber 
Nacht bei 50 °C durchgef uhrt . Nach Entfernung der 
Hybridisierungslosung wurde das Filter 10 sek in 2xSSC, 
1 % SDS bei Raumtemperatur gewaschen, anschliefiend 
wurde 10 sek lang bei 50°C gewaschen. Das Filter wurde 
in Saranwrap gewickelt und unter Verwendxing einer 
Verstarkerfolie der Autoradiographic unterworfen. 

Positive Phagenkolonien wurden auf der Originalplatte 
mittels Zuordnung des Autoradiogramms identif iziert \ind 
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die entsprechenden Agarstuckchen mit dem gr6Seren Ende 
einer Pasteur- Pipette entfernt. Der Phagen-Pool wurde 
uber Nacht bei 4°C in 1 ml SM-Puffer (5,8 g NaCl, 2 g 
MgS0 4 -H 2 0, 50 ml Tris pH 7.5, 5 ml 2 %ige Gelatine auf 
1 1 H2O) , enthaltend einige Tropfen CHCI3 , eluiert. 
Das Phagenlysat wurde fur eine zweite und dritte 
Screeningrunde wieder ausplattiert urn einzelne, gut 
isolierte positive Plaques (20 bis 100 Plaques pro 
Platte in der dritten Runde) zu erhalten, 

d) Sequenzanalyse 

Die cDNA- Inserts von rekombinanten Phagen wurden in den 
Polylinker von pBluescript KS (Stratagene) subkloniert 
und auf einem automatischen Sequenzer (Applied 
Biosystems) unter Verwendung der Didesoxy-Methode 
sequenziert. Die komplette Sequenz von wenigstens zwei 
unabhangigen Isolaten pro erhaltenen Gen wurde mittels 
"Primer walking" ermittelt. Die Sequenzen wurden mit 
dem GCG- Software -Paket (University of Wisconsin) 
analysiert, die Untersuchung auf Homologie wurde mit 
dem "Blast and fasta" oder "tfasta" Netzwerkservice 
durchgef dhrt . Die kompletten Sequenzen von EZH2 und 
SUV39H Bind in Fig. 6 und 7 dargestellt. 
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Patentanspruche 

1. DNA-Molekiile, enthaltend eine fur ein 
Chromatinregulator- Protein, das eine SET-Domane 
aufweist, kodierende Sequenz oder eine 
Teilsequenz davon, dadurch gekennzeichnet , dafi 
sie die in Pig. 6, Fig. 7 oder Fig. 8 
dargestellte Nukleotidsequenz, kodierend fur 
EZH2, SUV39H oder EZH1, einschliefilich ihrer 
degenerierten Variant en sowie Mutant en davon, 
enthalten. 

2. DNA-Molekill nach Anspruch 1, dadurch 
gekennzeichnet, daS es eine cDNA ist. 

3 . DNA-Molekiil nach Anspruch 1 oder 2 , dadurch 

gekennzeichnet, dafi es humanen Ursprungs ist. 

4. cDNA nach Anspruch 3 der Bezeichnung EZH2. 

5. cDNA nach Anspruch 3 der Bezeichnung SUV39H. 

6. DNA-Molekul nach Anspruch 4, dadurch 
gekennzeichnet, dafi es die fur die SET-Domane 
von EZH2 kodierende Region oder einen Abschnitt 
davon enthalt. 

7. DNA-Molelcul nach Anspruch 5, dadurch 
gekennzeichnet, dafi es die fur die SET-Domane 
SUV39H kodierende Region oder einen Abschnitt 
davon enthalt. 

8. DNA-Molekul nach Anspruch 4, dadurch dafi es fur 
eine dominant -negative Mutante von EZH2 kodiert. 
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9. DNA-Molekul nach Anspruch 4, dadurch dafi es fur 
eine dominant -negative Mutante von SUV39H 
kodiert . 

10. Rekombinantes DNA-Molekiil, enthaltend eine in 
Anspruch 2 definierte cDNA, funktionell 
verbunden mit Expressionskontrollsequenzen, zur 
Expression in prokaryotischen oder 
eukaryotischen Wirtsorganismen. 

11. Prokaryotische oder eukaryotische 
Wirtsorganismen, transformiert mit rekombinanter 
DNA nach Anspruch 10. 

12. Rekombinantes humanes Chromatinregulator- Protein 
EZH2 oder ein Abschnitt davon, erhaltlich durch 
Expression einer in Anspruch 4 def inierten cDNA. 

13. Rekombinantes humanes Chromatinregulator-Protein 
SUV39H oder ein Abschnitt davon, erhaltlich 
durch Expression einer in Anspruch 5 def inierten 
cDNA. 

14. Antikorper gegen EZH2 . 

15. Antikorper gegen SUV39H. 

16. Antisense(desoxy)ribonukleotide mit 
Komplementaritat zu einer Teilsequenz einer in 
Anspruch 1 def inierten DNA. 

17. DNA-Molekul, kodierend fur die SET-Dom^ne eines 
Chromatinregulator -Gens , bzw. fiir einen 
Abschnitt davon, zur Behandlung und Diagnose von 
Erkrankungen des Menschen, die auf eine 
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Deregulation von Chromatinregulator-Genen, die 
eine SET-Domane aufweisen, zuruckzufuhren sind. 

DNA-Molekiil nach Anspruch 6 oder 7 zur 
Behandlung und Diagnose von Erkrankungen des 
Menschen, die auf eine Deregulation von 
Chromatinregulator-Genen, die eine SET-Domane 
aufweisen, zuruckzufuhren sind. 

Antikorper nach Anspruch 14 oder 15 zur 
Behandlung und Diagnose von Erkrankungen des 
Menschen, die auf eine Deregulation von 
Chromatinregulator-Genen, die eine SET-Domane 
aufweisen, zuruckzufuhren sind. 

Transgene Maus, enthaltend ein Transgen fur die 
Expression eines Chromatinregulator-Gens, das 
eine SET-Domane aufweist, oder einer mutierten 
Version eines solchen Proteins. 

Knock-out Maus, erh&ltlich aus embryonalen 
Stammzellen, in denen die endogenen Maus-Loci 
fur Ezhl und Suv39h dxirch homologe Rekombination 
iinterbrochen wurden. 

Verf ahren zum Identif izieren von Saugetier- 
Chroraat inregulat or - Genen , die eine SET-Domane 
aufweisen, oder mutierten Versionen davon, 
dadurch gekennzeichnet , dafi man S^ugetier-cDNA- 
oder genomische DNA-Bibliotheken unter 
Bedingungen niedriger Stringenz mit einem DNA- 
Molekul, kodierend f&r die SET-Domane oder einen 
Abschnitt davon, hybridisiert . 
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Fig. 5 

E(z) SDIA§$SIFL KEGAQKNEFI SMCGfcllSQ DE£DF®GKVS DK. .YMCSFL 50 

EZH2 SDVi^gTFI KDPVQKNEFI S^&IgSQ 0^1^310^ DK..*MCSFL 

HRX SPIH^LFC KRNIDAGEMV I§£A&Jvtks IQ^K^EK^i DSKGIG.CYM 

trx SHIH||||LYC TKDIEAGEMV iM^lftlS TI|^K|ER*p DSRGIG.CYM 

C26 SRIH^gLYA MESIAPDEMI ^Ip3T^lS Lv|eE^EKa| : ERRGIGSSYL 

YHR SAIH&SpLYA LDSIAAKEMI I^Vj^H&Q PV|bJiEKF§ LKNGIGSSYL 

SU3-9 ANGS^bvRA ATALRKGEFV O^ilsi^rS DE^JgK^ DDNG. .RTYL 

SUV39H DDGR^pVRT LEKIRKNSFV m S^ ^TS EE|p|GQl| DRQG..ATYL 

G9a TAKM^pVRA LQTIPQGTFI C^VffillsD AE2a>JLvJ| .RED* .DSYL 

KG-1 TQNK^^IRC LDDIAKGSFV C^|a^Ci|tD Df||dKSGL .f| .EMG. .DEYF 

/ 

E(z) NDFW^RK ^CI^Z^S Il^CYAKVM MVTGDH 100 

EZH2 pill NDFV\^PRK ftciI#^S VN^CYAKVM MVNGDH 

HRX W*m DSEV^TMH ^RAlS^S CE|^CYSRVI NIDGQK 

trx W*W DNLV^TMR ^AAIp^3 C^CYSKW DILGHK 

YHR ENTVI^pTKK ^^Al^^fc O^CTAKII KVGGRR 

Su3~9 |pi||YNTAQD SEYTIjpANY ^ISi^TOp GD||ELAVFPC WIEHLNVALP 

SUV39H |Dl||y...VE DVYTV^kYY &ISI^vl|S CdIIIlQVYNV FIDNLDERLP 

G9a |pi||NK. .DG EVYCIpl^YY HlSRi^pL CD^IIPVRV FMLHQDLRFP 

KG-1 pnlHI..ES VEYII^LE i|tt*GI®^S CS&LFVQNV FVDTHDLRFP 

A 

EU) I^^i^M QP^HFB^ ..RYGPTEQL K FVpI EREMEIV* 150 

EZH2 I^33mi^& QT||||FFg| . . RYSQADAL K YV||l EREMEIP* 

HRX iM/I^Mgci YR^^T^ . .KFPIE.DA SNKLPCNC^ KKCRKFLN* 

trx ^^y*a|| V^^^T^ ..KFPFE.D. .EKIPCSC|S KRCRKYLN* 

C26 J^TI^K^^ KK^Mw^^ ..KFPIE... DDKIDCLC^ KTCRGYLN* 

YHR F^nmiitDi AA^^X^® . .KFEREKDD EERLPCLC^ PNCKGFLN* 

Su3-9 ^vfSpi^P ka^^seH .IRADNEDVP YENLSTA.S 

SUV39H I%iBm3pI^ RA^Sr£^| NMQVDPVDME STRMDSNF§*L AGLPGSPKKR 

G9a B^E^^l RT^^GB^ GDRFW. _DIK SKYFTCQcis EKCKHSAEAI 

KG-1 TOMiMpl RA^^T^ NYEVG. . SVE GKELLCCC^V IECR 



E(z) 
EZH2 

HRX 
trx 
26 
YHR 

Su3-9 VRVECRCGRD NCRKVLF* 

SUV39H VRIECKCGTE SCRKYLF* 

G9a ALEQSRLARL DPHPELLPEL GSLPPVNT* 

KG-1 GRI*L* 
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EZH2 Lange: 2600bp (kodierend: 90-2330) 



1 AGGCAGTGGAGCCCCGGCGGCGGCGGCGGCGGCGCGCGGGGGCGAGGCGCGGGAACAACG 60 

• »•■•• 

61 CGAGTCGGCGCGCGGGACGAAGAATAATCATGGGCCAGACTGGGAAGAAATCTGAGAAGG 120 

NGQTGKKS EKG 

• • • • • • 

121 GACCAGTTTGTTGGCGGAAGCGTGTAAAATCAGA^ 180 
PVCWRKRVKSEYMRLRQLKR 

• ••••• 

181 GGTTCAGACGAGCTGATGAAGTAAAGAGTATGTTTAGTTCCAATCGTCA 240 
FRRADEVKSMFSSNRQKILE 

• • » » • • 

241 AAAGAACGGAAATCTTAAAOCAAGAATGGAAACAGCGAAGGATACAGCCTGTGCACATCC 300 
RTE ZLNQBWKQRRZQPVH.il 

301 TGACTTCTGTGAGCTCATTGCGCGGGACTAGGGAGT^ 360 
TSVSSLRGTRECSVTSDLDF 

361 TTCCAACACAAGTCATCCCATTAAAGACTCTGAATGCAGTTG 420 
PTQVZPLKTLNAVASVP IMY 

421 ATTCTTGGTCTCCCCTACAGCAGAATTTTATGGTGGAAGATGAAACTGTTTTACATAA^ 480 
SWSPLQQNFMVEDETVLHNZ 

481 TTCCTTATATGGGAGATGAAGTTTTAGATCAGGATGGTACTTTCATTGAAGAACTAATAA 540 
PYMGDBVLDQDGTFIEELZK 

• • • » • • 

541 AAAATTATGATGGGAAAGTACACGGGGATAGAGAATGTGGGTTTATAAATGATGAAATTT 600 
NYDGKVHG DRECGFZNDEZF 

» • • • • m 

601 TTGTGGAGTTGGTGAATGCCCTTGGTCAATATAATGATGATGACGATGATGATGATGGA^ 660 
VELVNALGQYNDDDDDDDG.D 

• • • • • • 

661 ACGATCCTGAAGAAAGAGAAGAAAAGCAGAAAGATCTGGA 720 
DPEEREEKQKDLEDHRDDKE 

721 AAAGCCGCCCACCTCGGAAATTTCCrrCTGATAAAAT^ 780 
SRPPRKFPSDKZFEAZSSMF 

• ■ • • • • 

781 TTCCAGATAAGGGCACAGOU3AAGAACTAAAGGAAAAATATAA 840 
PDKGTAEELKEKYKELTEQQ 

• • • • • • 

841 AGCTCCCAGGCGCACTTCCTCCTGAATGTACCXXCAA 900 
LPGALPPBCTPNZDGPNAKS 

• ••••• 

901 CTGTTCAGAGAGAGCAAAGCTTACACTCCTTTCATACGCT T T TCTGT AGGCGATGTTTTA 960 
VQREQSLHSFHTLFCRRCFK 

• • • m • • 

961 AATATGACTGCTTCCTACATCCTTTTCATGCAACACCCAACACTTATAAGCGGAAG 1020 
YDCFLHPFRATPNTYKRKNT 

• • • • • • 

1021 CAGAAACAGu it- 1 AGACAACAAACCT TGTGGACCACAGTGTT ACCAGCATTTGGAGGGAG 1080 
BTALDNKPCGPQCYQHLEGA 

• " • m • • • 

1081 CAAAGGA GTTTGCTG CTGCT CTC ACCGCTGAGCGGATAAAGAGOCCAOCAA 1140 
KB F AAALTAERI KTP PKRPG 
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Fig. 6/2 



• • • • • • 

1141 GAGGCCGCAGAAGAGGACGGCTTCCCAATAACAGTAGCAGGCCCAGC^ 1200 
GRRRGRLP NNSS RPS TPTIN 

1201 ATGTGCTGGAATCAAAGGATACAGACAGTGATAGGGAAGCAGGGACTGAAACGGGGGGAG 1260 
VLESKDTDSDREAGTETGGE 

• • • * • • 

1261 AGAACAATGATAAAGAAGAAGAAGAGAAGAAAGATGAAACTTCGAGCTCCTCTGAAGCAA 1320 
NNDKEEEEKKDETSS S SEAN 
• • • • • • 

1321 ATTCTCGGTGTCAAACACCAATAAAGATGAAGCCAAATATTGAACCTCCT 1380 
SRCQTP IKMKPNIEPPENVE 

• • • • • • 

1381 AGTGGAGTGGTGCTGAAGCCTCAATGTTTAGAGTCCTCATTGGCACTTACTATGACAATT 1440 
WSGAEASMFRVLIGTYYDNF 

1441 TCTGTGCCATTGCTAGGTTAATTGGGACCAAAACATGTAGACAGGTGTAT 1500 
CAIARLIGTKTCRQVYEFRV 

1501 TCAAAGAATCTAGCATGATAGC7CGAGCTCCCGCTGAGGATGTGGATACTCCTCXA71GGA 1560 
KESSIIAPAPAEDVDTPPRK 

KKRKHRLWAAHCRKI QLKK D 

1621 ACGGCTCCTCTAACCATGTTTACAACTATCAACCCTGTGATCATC 1680 
GSSNHVYNYQPCDHPRQPCD 

1681 ACAGTTCGTGCCCTTGTGTGATAGCACAAAATTTTTGTGAAAACT 1740 
SSCPCVIAQNFCEKFCQCSS 

• • • • ■ • 

ECQNRFPGCRCKAQCNTKQ C 

1601 GCCCGTGCTACCTGGCTGTCCGAGAGTGTGACCCTGACCTCTGTCTTACTTCT 1860 
PCYLAVRECDPDLCLTCGAA 
■ • • • • • 

1861 CTGACCATTGGGACAGTAAAAATGTGTCCT« 1920 
DHWDSKNVSCKNCS IQR6S K 

• ••••• 

1921 AAAAGCATCTATTGCTGGCACCATCTGACGTGGCAGGCTGGGGGAT TTTTATCAAAGATC 1980 
KHLLLAPSDVAGWGIFIKDP 

m m • • • • 

1981 CTGTGCAGAAAAATGAATTCATCTCAGAATACTGTGG 2040 
VQKNEFISEYCGE II SQDEA 

• • • • • • 

2041 CTGACAGAAGAGGGAAAGTGTATGATAAATACATGTGCAGCTTTCTGTTCA 2100 
DRRGKVYDKYMCS FLFNLNN 

• » a ■ • • 

2101 ATGATTTTGTGGTGGATGCAACCCGCAAGGGTAACAAAATO 2160 
DFVVDATRKG N K IRFANHSV 

• ••••• 

2161 TAAATCGAAACTGCTATGCAAAAGTTATGATGGTTAACGCT 2220 
NPNCYAKVMMVN GDHRIGIF 

• • • • • • 

2221 TTGCCAAGAGAGCCATCCAGACTGGCGAAGAGCTGTTT TTT GATTACAGA 2280 
AKRAIQTGEELFFDYRYSQA 
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2281 CTGATGCCCTGAAGTATGTCGGCATCGAAAGAGAAATGGAAATCCCTTGACATCTGCTAC 2340 
DALKYVGIEREMEIP* 

2341 CTCCTCXCCCTCCTCTGAAACAGC^ 2400 

* 

2401 TTTAGAAAAAGAACATGCAGTTTGAAATTCTGAATOT 2460 

2461 ATACTAATGAGTTTAAAAATCAACTTTTTATT^ 2520 

2521 TACCAGTGAATTTTTGC3UITAATGCAGTATGCTACATTTTTCAACTTTGAA 2580 
2581 CTTGAACTTGTCAAAAAAAA 2600 
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SUV39H Lange: 2732 bp (kodierend: 45-1284) 



1 TCGCGAGGCCGGCTAGGCCCGAATGTCGTTAGCCGTGGGGAAAGATGGCGGAAAATTTAA 60 

M A E N L K 

61 AAGGCTGCAGCGTGTGTTGC2UVGTCTTCTTGGAATCAGCT 120 
GCSVCCKSSWNQLQDLCRLA 

121 CCJUVGCTCTCCTGCrCTGCCCTCGGTATCTCT^ 1B0 
KLSCPALGISKRNLYDFEVE 

• »*••• 

181 AGTACCTGTGCGATTACAAGAAGATCCGCGAACAGGAATATTACCTGGTGAAATGGCGTG 240 
YLCDYKKIREQEYYLVKWRG 

• ••••• 

241 GATATCCAGACTCAGAGAGCACCTGGGAGCCACGGCAGAATCTCAAGTGTGTGCGTATCC 300 
YPDSESTWEPRQNLKCVRIL 

• ••••• 

KQFHKDLERELLRRHHRSKT 

361 CCCCCCGGCACCTGGACCCAAGCTTGGCC^^ 420 
PRHLDP S LANYLVQKAKQRR 

• ••••• 

421 GGGQ^TCCGTCGCTGGGAGCAGGAGCTCAATGCCAAGCGCAGCCATCTGGGACGCATCA 480 
ALRRWE QELNAKRSHLGRIT 

» • • • • • ■ 

481 CTGTAGAGAATGAGGTGGA0CT6GACGGCCCTCC6CGGGCCTTC6TGTACATCAA7GAGT 540 
VENEVDLDGPPRAFVY1NEY 

• • • • • • 

600 

QVAVGCECQDC 

601 GTCTGTGGGCACCCACTGGAGGCTGCTGCCCGGGGGCGTCACTGCACAACT 660 
LWAPTGGCCPGASLHKFAYN 

• ••••• 

661 ATGACCAGGGCCAGGTGCGGCTTCGAGCCGGGC^^ 720 
DQGQVRLRAGLPIYECNSRC 

• ••••• 

721 GCCGCTGCGGCTATGACTGCCCAAATCGTGTGGTACAGAAGGGTATCCGATATGACCTCT 780 
RCGYDCPNRVVQKGIRYDLC 

781 GCATCTTOOGGaOGGATGATOGGCGTGGCTCg 840 
IFRTDDGRGWGVRTLEKIRK 

841 AGAACAGCT TCGTCATGGAGTACGTGGGAGAGATCATTACCTCAGAGGAGGCAGAGCGGC 900 
NSFVMEYVGEI ITSEEAERR 

• • • • ■ » 

901 GGGGCCAGATCTACGACCGTCAGGGCGCCACCTACCT 960 
GQIYDRQ6ATYLFDLDYVED 

• ••••• 

961 ACGTGTACACCGTGGATGCCGCCTACTATGGCAACATCTCCCACT 1020 
VYTVDAAYYGN ISHFVNHSC 

• ••••• 

1021 GTGACCCCAACCTGCAGGTGTACAACGTCTTCATAGACAACCTTGACGAGC GGCT 1080 
DPNLQVYNVFI DNLDERLPR 

• ••••• 

1081 GC ATCGCTT T C7 T TGCCACAAGAACCATCCGGGCAGGCGAGGAGCTCACCTTTGATTACA 1140 
IAFFATRTIRAGEBLTFDYN 
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1141 ACATGCAAGTGGACCCCGTGGACATGGAGAGCACCCGCATGGACTCCAACTTTGGCCTGG 
MQVDPVDMESTRMDSNFGLA 

• • • • ■ • 
1201 CTGGGCTCCCTGGCTCCCCTAAGAAGCGGGTCCGTATTGAATGCAAGTGTGGGACTGAGT 

GLPGS PKKRVRIECKCGTES 

• »••■» 
1261 CCTGCCGCAAATACCTCTTCTAGCCCTTAGAAGTCTGAGGCCAGACTGACTGAGGGGGCC 

C R K Y L F * 



1321 



rGTCGAGAATGACTGCCAGGGCCTC 



1381 GCCTGCCTCCACCTGCCCCCACCTGCTCCTACCTGCTCT2 

• « 
1441 GTGAGGACCGACTCCAGGAC 



HTCTGTGGGTTGCACTT 



1501 ACAAACCCCCACCCACCTTCAGAAATAGTTTTTCAACATCAAGACTC 

• • • • • • 
1561 TTCATGGCCTATTAAGGAGGTCCAAGGGGTGAGTCCCAACCCAGCGCCAGAATA 

» • • • 

1 621 TTTTTGCACCTGCTTCTGCCTGGAGATTGAGGGGTCTGCTGCAGGCCTC 

• • • • 
1681 CCCAAAGGTATGGGGAAGCAACCCCAGAGCAGGCAGACAT 

• ••••• 
1741 CCGACATGAAGCTGGTTCCCCAACCACAGAAACTTTGTACT 

• • • • 
18 61 AAGAGCTGTAGGGTCTCTTCTTCAGGGCTGCATATCTGAGAAGTGGATGCCCACATGCCA 

1921 CTGGAAGGGAAGTGGGTGTCCATGGGCCACTGAGCAGTGAGAGGAAGGCM 

1981 




2041 AGGGCTCTT 

2101 CACCACTCAGAGCTGGAACCAAGATCTAGATAGT^ 

• • • ■ • • 
2161 GTGCATTGATGGGGTGGTGATGAGGTGCCAGGCAC^ 

• • • • • • 
2221 ATTGTCTGAGGGAAGCCTTGAAAACCACGGAGGTGGATC 

• • m • » • «. 
2281 AGAAGGCAAAGTAC^GGCCAAGAATTGGGGGTGGGGGAGA 

2341 GACGA 

2401 AC CC TG G TTCCAgreGTCTCAAAAGTCACCTGCCTACAAATCT 
2521 CCTGACTACCTGTGCCCAGAGTGCCCCTACATGAGACTCT 

2641 GGACTGAATCTGGTTCTCCTCTTGTACACCCCTCAACXCT 

• • • 

2701 CAATAAAATGAACTGTCGACTGAAAAAAAAAA 2732 
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EZHZ * 8 44 TCTTACTTGTGGAGCCGCTGACCATTGGGACAGTAAAAATGTGTCCTGCA 1893 

II II Mill III I II II I I I I I I I II II Mill I 

EZH1 1 ACTCACCTGTGGGGCCTCAGAGCACTGGGACTGCAAGGTGGTTTCCTGTA 50 

• • * • • 

1894 AGAACTGCAGTATTCAGCGGGGCTCCAAAAAGCATCTATTGCTGGCACCA 1943 

I MUM II II lllll II II Mill II MM I II II 
51 AAAACTGCAGC^TCCAGCGTGGACTTAAGAAGCACCTGCTGCTGGCCCCC 100 
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